Fechar

1. Identificação
Tipo de ReferênciaTese ou Dissertação (Thesis)
Sitemtc-m21c.sid.inpe.br
Código do Detentorisadg {BR SPINPE} ibi 8JMKD3MGPCW/3DT298S
Identificador8JMKD3MGP3W34R/433H4PS
Repositóriosid.inpe.br/mtc-m21c/2020/08.12.17.37
Última Atualização2021:05.18.16.58.28 (UTC) simone
Repositório de Metadadossid.inpe.br/mtc-m21c/2020/08.12.17.37.59
Última Atualização dos Metadados2022:04.03.23.15.37 (UTC) administrator
Chave SecundáriaINPE-18362-TDI/3026
Chave de CitaçãoPinheiro:2021:PrPrMo
TítuloPredição de propriedades moleculares via aprendizado de máquina e representação SMILES
Título AlternativoMachine learning prediction of molecular properties based on the SMILES representation
CursoCAP-COMP-DIPGR-INPE-MCTI-GOV-BR
Ano2021
Data2020-07-29
Data de Acesso28 abr. 2024
Tipo da TeseDissertação (Mestrado em Computação Aplicada)
Tipo SecundárioTDI
Número de Páginas165
Número de Arquivos1
Tamanho4299 KiB
2. Contextualização
AutorPinheiro, Gabriel Augusto Lins Leal
GrupoCAP-COMP-DIPGR-INPE-MCTI-GOV-BR
BancaVijaykumar, Nandamudi Lankalapalli (presidente)
Quiles, Marcos Gonçalves (orientador)
Soares, Marinalva Dias (orientadora)
Santos, Rafael Duarte Coelho dos
Fileti, Eudes Eterno
Prati, Ronaldo Cristiano
Endereço de e-Mailgalinslp@gmail.com
UniversidadeInstituto Nacional de Pesquisas Espaciais (INPE)
CidadeSão José dos Campos
Histórico (UTC)2020-08-12 17:38:00 :: galinslp@gmail.com -> administrator ::
2020-08-19 22:53:29 :: administrator -> pubtc@inpe.br ::
2020-08-19 22:54:12 :: pubtc@inpe.br -> galinslp@gmail.com ::
2020-09-18 03:39:20 :: galinslp@gmail.com -> administrator ::
2020-09-18 15:26:24 :: administrator -> pubtc@inpe.br ::
2020-09-18 15:27:04 :: pubtc@inpe.br -> galinslp@gmail.com ::
2020-09-23 18:04:18 :: galinslp@gmail.com -> administrator ::
2021-03-08 13:53:38 :: administrator -> pubtc@inpe.br ::
2021-05-18 16:51:28 :: pubtc@inpe.br -> simone ::
2021-05-18 18:49:18 :: simone :: -> 2021
2021-05-18 18:55:01 :: simone -> administrator :: 2021
2022-04-03 23:15:37 :: administrator -> :: 2021
3. Conteúdo e estrutura
É a matriz ou uma cópia?é a matriz
Estágio do Conteúdoconcluido
Transferível1
Palavras-Chaveaprendizado de máquina
SMILES
redes neurais
ciência dos materiais
propriedades moleculares
machine learning
SMILES
neural networks
materials science
molecular properties
ResumoO campo de ciência dos materiais possui caráter interdisciplinar, com aplicações nas mais diversas áreas do conhecimento que acabam influenciando vários aspectos da vida cotidiana. Pode-se citar como exemplo de aplicações pesquisas relacionadas à energia renovável, saúde, engenharia mecânica, aviação e espaço. Nesta área da ciência, o estudo das propriedades dos materiais e as relações com suas estruturas em escala atômica ou molecular torna-se imprescindível para a descoberta de novos materiais, requerendo assim, o conhecimento de como estes se comportam e reagem uns com os outros em diferentes ambientes. Na área espacial, por exemplo, o desenvolvimento de nanotecnologias para a composição das estruturas de um satélite pode permitir a descoberta de materiais mais leves e resistentes a danos de radiação. Contudo, abordagens tradicionais em ciência dos materiais, como a teoria do funcional da densidade, usadas no processo do cálculo das propriedades físico-químicas de um material, são computacionalmente custosas. Por outro lado, a quantidade de dados providos sobre cálculos e experimentos realizados na última década possibilitou a aplicação de algoritmos de aprendizado de máquina como alternativa aos métodos tradicionais, tendo por vantagem a otimização no tempo do cálculo. Para que o algoritmo de aprendizado de máquina realize um mapeamento adequado entre a entrada e saída, é necessário fazer a descrição da molécula, chamado de descritor ou atributo, de maneira a codificar informações significativas presentes no sistema molecular. Neste sentido, este trabalho visou explorar o uso de descritores baseados na representação Simplified Molecular Input Line Entry System (SMILES) para a predição de propriedades moleculares. Para isso, utilizou-se uma rede Perceptron de múltiplas camadas e cinco métodos de seleção de atributos. As melhores predições foram obtidas para as propriedades térmicas, que atingiram um erro absoluto médio próximo a 0.05 eV e portanto, bem próximo ao erro aceitável pela acurácia química. ABSTRACT: The field of material science is characterized by its interdisciplinary in several scientific areas, which influences diverse aspects of daily life. For instance, one can cite material science applications in clean energy, health, mechanical engineer, and aircraft materials. In this realm, the study of materials properties and its relationship with the molecular structure at the atomic or molecular scale is crucial for the development of new materials, requiring an understanding of the behavior of the material to different environments and other materials. In aerospace applications, for instance, the development of nanotechnology for satellites structure can achieve materials more resistant to spatial radiation and weightless. Nevertheless, traditional approaches in material science (i.e., density functional theory) used to compute the physicochemical properties demand high computational resources. By contrast, the amount of available data provided from previous calculations and experiments in the last decade has allowed the application of a machine learning algorithm as an alternative approach for such computations with less time and computational resources. However, machine learning algorithms rely on a well suitable representation of the data to perform an accurate prediction. Thus, molecular features, or descriptors, are essential to encode meaningful information present in the molecules. In this sense, this work aims to explore molecular descriptors based in the Simplified Molecular Input Line Entry System (SMILES) representation to predict molecular properties. For that, it was used a multilayer perceptron and five feature selection methods. The best achievements in this work obtained an error, in terms of mean absolute error, of 0.05 eV for the thermodynamic properties, which is an error close to the chemical accuracy.
ÁreaCOMP
Arranjo 1urlib.net > BDMCI > Fonds > Produção pgr ATUAIS > CAP > Predição de propriedades...
Arranjo 2urlib.net > BDMCI > Fonds > Produção a partir de 2021 > CGIP > Predição de propriedades...
Conteúdo da Pasta docacessar
Conteúdo da Pasta source
originais/@4primeirasPaginas.pdf 18/03/2021 11:16 414.5 KiB 
originais/Avaliaçaõ Final Gabriel Augusto Lins Leal Pinheiro CAP-1.pdf 18/09/2020 14:15 168.2 KiB 
originais/publicacao (1).pdf 23/09/2020 16:55 3.8 MiB
Conteúdo da Pasta agreement
autorizacao.pdf 18/05/2021 11:47 162.7 KiB 
4. Condições de acesso e uso
URL dos dadoshttp://urlib.net/ibi/8JMKD3MGP3W34R/433H4PS
URL dos dados zipadoshttp://urlib.net/zip/8JMKD3MGP3W34R/433H4PS
Idiomapt
Arquivo Alvopublicacao.pdf
Grupo de Usuáriosgalinslp@gmail.com
simone
Visibilidadeshown
Licença de Direitos Autoraisurlib.net/www/2012/11.12.15.10
Detentor dos Direitosoriginalauthor yes
Permissão de Leituraallow from all
Permissão de Atualizaçãonão transferida
5. Fontes relacionadas
Repositório Espelhourlib.net/www/2017/11.22.19.04.03
Unidades Imediatamente Superiores8JMKD3MGPCW/3F2PHGS
8JMKD3MGPCW/46KUES5
Lista de Itens Citandosid.inpe.br/bibdigital/2022/04.03.23.11 1
sid.inpe.br/bibdigital/2013/10.12.22.16 1
Acervo Hospedeirourlib.net/www/2017/11.22.19.04
6. Notas
Campos Vaziosacademicdepartment affiliation archivingpolicy archivist callnumber contenttype copyholder creatorhistory descriptionlevel dissemination doi electronicmailaddress format isbn issn label lineage mark nextedition notes number orcid parameterlist parentrepositories previousedition previouslowerunit progress readergroup resumeid schedulinginformation secondarydate secondarymark session shorttitle sponsor subject tertiarymark tertiarytype url versiontype


Fechar